In [2]:
! fastaFromBed -fi /Volumes/web/cnidarian/oyster.v9.fa -bed /Volumes/web/trilobite/Crassostrea_gigas_v9_tracks/Cgigas_v9_exon.gff -fo /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons.fa
In [3]:
! head /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons.fa
>C16582:34-385
TCAGTTCGTTAGCGCAACCAATGCTTCCACAACGTCCCCATTGTGTTCTCGTAATGTCCGTTCAGCTATTTGTCTTGTTATTTCCATTTCCGCTACAATCAAATCAACATCTTCTTTGTTTATTTTTACTTTTGCTAGTTCCCGCTCCCTTTCCTGTTTTTTAGCCCTCTCTTTTGTTTTCCGGTCACTCATTGCTTTCATAGCATCTCCTATGCTTTGTGCCGAAATTTCCTTTTCTTCAACATAATCGGTGACCTTTTCAAGATCTCTTGCACCCGAATCATGCTTCTTTGTCTTAATTTCCGTTGATTCTTCCACTTCGATTTGAGGGTCTTCCTCAGTGTTCGCCAT
>C17212:30-363
ATGTATGGAGTGATGAATTCCAATATCCATGAACACATAAACAACAGTATCATGAAATGTGATGTGGATATCCATGAAGACATGTTCTCTAACATTGTGTTATCTGGAGGTTCAACCATGTTTCCAGGTATAGCCGATCGTATGCAGAAAGAAATCACAGCACTTGCTCCAAGCTCTATTAAAGTCAAAATCATTGCTCCACCCGAGAGGAAATACTCCGCCTGGATTGGAGGATCCATCCTGGGTTCTCTCTCCACTTTCGAAGATATGTGGATCAGCAAAGAGGAATACGATGAAAATGGTCCCTGCATTGTTCACAAGAAGTGCTTCTAA
>C17316:29-257
ATGGCGTTTACTACACGGGATCAGGATGATGACAGGTGGAGCGGCGGAAACTGTGCCACCGACTGGGGTTCCGCTGGGTGGTTCAATATATGTTTCAAGGCCAACCCTAATGGACAGTATATAGACTTTGAGAAGACAAATGATCCTAAATACCTTGTATGGTATCACTGGAAAAACTCGTGGGTGTCTCTGAAATCGATGAAATTGATGATTCGTCCTCGAGCTTGA
>C17476:103-257
CCATTTCCTTCACATAATCTTCCAATTTCTGCAGGGCCCTTTTTTCGGAATCCATTTTCCCCTCCATCCGTCTGCCGATGACATCTTTCAGAAAAAGTATTCCAGGTTCGAAAATAAGGGAAAAGTTTATGGCCAAAGGAAAGTCCCCGTACAT
>C17476:33-74
TTACACGATATTGCAGCTAAATTGTAGGCCAAGATAACGCT

In [4]:
! wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons.fa
  393382  393382 42400218 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons.fa

In [6]:
! wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons_nucleotides
  196691  196691 37121309 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Exons_nucleotides

In []:
# The number of nucleotides for Exons is 37121309
In [7]:
! fastaFromBed -fi /Volumes/web/cnidarian/oyster.v9.fa -bed /Volumes/web/trilobite/Crassostrea_gigas_v9_tracks/Cgigas_v9_intron.gff -fo /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Introns.fa
In [8]:
! head /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Introns.fa
>C17476:74-103
CTTTAGAAAACAATAGATATAATATTTAC
>C19392:183-451
GTGAGCTTAGAAGGCACACTTTATTCTATTGTGATGACAGTGTATACCTTTATAGCTTTACGCATTATAGCAGTGATGACTGTTACTTTAGACTTGAAGCTTCAGACCATTAGTATTGTATGATGCAAGTGTCAAGTGACTTGGAGATTTAGTAATAGTAGTCAATATTAAATACATGCATGTGAAATTGTAGGTAAATTTTTTTGTTCAATCCAGTTAAGTGTAATTTTTATATTTTTTTTTAATCCATATATGTTGATTGTTCCAG
>C20262:538-641
CTGCAGCAAAATACACAATTTTATAAAGAATTAATTTGTCAATAAATGGGTTTCAGAAATGATATATATTTTAAGTAAAATACTGCATTATACATTGTTGTAC
>C20262:649-871
CTAATTTGAACAATTTCAACTATTTATACATTTATATTACCGTTTCTCGCATACTATTAGTTATTCAGGTCCAATCCACAGGCACCTGACGTTATATGTTTTTCTCATAATAAAAAAACATCCTATATCTAATAAAACATATAGAATTGATAAAAAAATTAACCTACCATTTTTTTCTGATAATGAGAATTGTGACCGATATGACATATATTTTACACGCAC
>C20334:523-867
CTAAAATTGTAAAATATTTCCACAATATCAGAGTAAAGGAACTACATTTTGGAACAAATATTGCAGAATTTTTAAATTCTGCACAATTTATACAAATGTGCTTTATTTTAAATATGAGAGATGCAATCTGCAAATTGTAATGAATTGCATATTGCAACTGAAAGGTCATAAGGGAAAATTTTACTCAGTTTAATTTACACATGTATGAGAAAGATACATGTATCTAGATATACCATAGTTATATGTACATATGTGTTATATACGAGTTGCTGCCTTTAGCCCTTCACTAACCGAATATCCAAGATGACTCTATTTGTTGGATGAATAGTTCAATGAAAACTTAC

In [9]:
!grep -Ev '>' /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Introns.fa > /Users/claireellis/Desktop/Introns_nucleotides
In [10]:
! head /Users/claireellis/Desktop/Introns_nucleotides
CTTTAGAAAACAATAGATATAATATTTAC
GTGAGCTTAGAAGGCACACTTTATTCTATTGTGATGACAGTGTATACCTTTATAGCTTTACGCATTATAGCAGTGATGACTGTTACTTTAGACTTGAAGCTTCAGACCATTAGTATTGTATGATGCAAGTGTCAAGTGACTTGGAGATTTAGTAATAGTAGTCAATATTAAATACATGCATGTGAAATTGTAGGTAAATTTTTTTGTTCAATCCAGTTAAGTGTAATTTTTATATTTTTTTTTAATCCATATATGTTGATTGTTCCAG
CTGCAGCAAAATACACAATTTTATAAAGAATTAATTTGTCAATAAATGGGTTTCAGAAATGATATATATTTTAAGTAAAATACTGCATTATACATTGTTGTAC
CTAATTTGAACAATTTCAACTATTTATACATTTATATTACCGTTTCTCGCATACTATTAGTTATTCAGGTCCAATCCACAGGCACCTGACGTTATATGTTTTTCTCATAATAAAAAAACATCCTATATCTAATAAAACATATAGAATTGATAAAAAAATTAACCTACCATTTTTTTCTGATAATGAGAATTGTGACCGATATGACATATATTTTACACGCAC
CTAAAATTGTAAAATATTTCCACAATATCAGAGTAAAGGAACTACATTTTGGAACAAATATTGCAGAATTTTTAAATTCTGCACAATTTATACAAATGTGCTTTATTTTAAATATGAGAGATGCAATCTGCAAATTGTAATGAATTGCATATTGCAACTGAAAGGTCATAAGGGAAAATTTTACTCAGTTTAATTTACACATGTATGAGAAAGATACATGTATCTAGATATACCATAGTTATATGTACATATGTGTTATATACGAGTTGCTGCCTTTAGCCCTTCACTAACCGAATATCCAAGATGACTCTATTTGTTGGATGAATAGTTCAATGAAAACTTAC
CTAAAAAAAACACCAAACAGCTTTGCATCCGCTATGATGGTATGATTAAGAGTTTATAAAAATTTTAAAAACGATTTTCCCTCATCTTTGAACTGCTTTACTAATGTTTTTTAGATTTGTTGTGTTGGTGAAACTACTACTAAGTATTTGATTGGTTTTAATTAATATTTCATTAGCAGCTGAAAACATTTTTAC
CTGATAAAAGAACAAAAAGAAAACTCTAATATATTCGTAGCAACTTTATCAAGAAATCATAAAGTATTATGCAAACAATTACAATAATATTAATGAAGAAATAAACGAGAATGACCAACAGCAATAACAAAAACAAAGTAAATCTTTATTTACATCGATAATTATATCAAAAAAATGTTTAACATGATTGTTACAAAATTATTAAAATTATTAACCATTAAGACTTTTTTCAGCTGACTTAC
GTATAATATACAAGTACATTAACAACGTTCAGTTTGCTGTTTCTTTGTATTTTAATAATGTGTAACAATAGATAAGTCATTTGAAGTGACATGATGATTTCTGAATAAAATTGCTTTTACCTTTTCATGTACATGTTAATCATCATCTATCGCAAAACAATCTGAACTTAATTCCTTCATTTGGATACATGATTGCTTTAATGTTGTTAAAATTATATACAG
GTAAACACACACAATTATATCGTATCAGAGTTTTGAATTACACTTTGAATTAATTTTGAATTATTTGAATATCTAGTAGGTATAAATTGATATGATTTTACATGTACATTATTTTATTATAG
GTAAGTTTAATATATTGTATTTTCTTATTTAAAGTAACAGACAATATTATTGGTACTGTAAATAATAAATAATGTATTTCAATTTCCATGTGTTTCTCGAAAAATTCTCCTGAGTTTAGTATTTTCTTATTTTAATATAACAAATTGATACTGTACGCAATACATAATATTTATTAAATAATGTATGTCTATTTTCATGCATCCATTTGTTTCTCAAAAAATTCATGTATCTGAATTTTTCTACAG

In [11]:
! wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Introns_nucleotides
  176049  176049 188472529 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Introns_nucleotides

In []:
# The number of nucleotides for Introns is 188472529
In [12]:
! fastaFromBed -fi /Volumes/web/cnidarian/oyster.v9.fa -bed /Volumes/web/trilobite/Crassostrea_gigas_v9_tracks/Cgigas_v9_TE.gff -fo /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/TEs.fa
In [13]:
!grep -Ev '>' /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/TEs.fa > /Users/claireellis/Desktop/TEs_nucleotides
In [14]:
! head /Users/claireellis/Desktop/TEs_nucleotides
GGTTTACTTTCGGTTTACTCGGGGTTTACTTTCGGTTTACTCGGGGTTTACTTTCGGTTTACT
ATTTTCTGATATCAGAAAATGATTTTTTGATATCAGAAAATGATTTTCTGATATCAGAAATTGAAACTGATTTTTTGATATCAAGAATTATATTTTCTGATATCAGAAA
ATTTTCTGATATCAGAAAATAGATTTTCTGATATCAGAAAATGTAAATGATTTTTTGATATCAAAAAATGATTTTGTGATATCAAGAATTCGATTTTTTGATATCAAAAAATGATTTTCTGATATCAAGAATTCAATTTTTTGATATTAAAAAATCAACTTTAATTCTTGATATCAAAAAATCTATTTTGTGATATCAGAAAATAATTTTTTGATATCAAGAATTCGAATTTGTGATATCAAAAAATGATTTTCTGATATCACAAAATAGATTTTTTGATATCAAGAATTAATTTTTGATATCAAGAATTATTTTTTGATATCAAAAATTCGAATTATTGATATCAAATATTTATTTTTTGATATTAGAAAATA
ATTTTCTGATATCAGAAAATAGATTTTCTGATATCAGAAAATGTAAATGATTTTTTGATATCAAAAAATGATTTTGTGATATCAAGAATTCGATTTTTTGATATCAAAAAATGATTTTCTGATATCAAGAATTCAATTTTTTGATATTAAAAAATCAACTTTAATTCTTGATATCAAAAAATCTATTTTGTGATATCAGAAAATAATTTTTTGATATCAAGAATTCGAATTTGTGATATCAAAAAATGATTTTCTGATATCACAAAATAGATTTTTTGATATCAAGAATTAATTTTTGATATCAAGAATTATTTTTTGATATCAAAAA
CTCTCTCTCTCTCTCTCTCTCTCTCTCTC
GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA
TAAATACATCTAAGTGTAAATACATGTAAGTGTAAATGCATCTAAGTGTTAATACATCTAAGTGTA
GAAGTACTACAAAGTGCCCGGGGCTGATCCCACAGGCTAAATAAAATCCGGGCTGATCCCAGAGAAGTACTACAAAGTGGCCTGGGCTGATCCCTGCAGGCCTAATAAAACTCTGGGCTGATCCCAGGAGAGTAACGATGGTGCCCAGGGCTGATCCCTGTAGGCAATTTAACTCCGGGCTGATCCCAGGAGTAGCAGCATAACGATGGTGCCCAGGGCTGATCCCTGCAGGCAATTTAACTCTGGGCTGATCCCAGGAGTAGGACAAATGCCTGGGGCTGATCCC
TCTCTCTCTCTGTCTCTGTCTCTGTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTC
GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAG

In [15]:
! wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/TEs_nucleotides
  119787  119787 39534356 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/TEs_nucleotides

In []:
# The number of nucleotides for Transposable elements is 39534356
In [18]:
#promoter file had tracks where size = -1 and 0 (~7 total) those were removed, new file created
#this will cause error with fastaFromBed
!head /Volumes/web/cnidarian/Cgigas_v9_1k5p_gene_promoter_g1.gff
C20462	flankbed	promoter	1	2	.	+	.	ID=CGI_10000030;		1
C21500	flankbed	promoter	1	2	.	+	.	ID=CGI_10000050;		1
C23900	flankbed	promoter	1	2	.	+	.	ID=CGI_10000163;		1
C25124	flankbed	promoter	1	2	.	+	.	ID=CGI_10000231;		1
scaffold585	flankbed	promoter	1	2	.	+	.	ID=CGI_10005534;		1
C23298	flankbed	promoter	2188	2189	.	-	.	ID=CGI_10000113;		1
C23426	flankbed	promoter	2244	2245	.	-	.	ID=CGI_10000124;		1
C24184	flankbed	promoter	2612	2613	.	-	.	ID=CGI_10000181;		1
C24590	flankbed	promoter	2811	2812	.	-	.	ID=CGI_10000199;		1
scaffold1340	flankbed	promoter	22078	22079	.	-	.	ID=CGI_10001407;		1

In [19]:
!fastaFromBed -tab -fi /Volumes/web/cnidarian/oyster.v9.fa -bed /Volumes/web/cnidarian/Cgigas_v9_1k5p_gene_promoter_g1.gff -fo /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa
In [20]:
!wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa
   28012   56024 28148853 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa

In [21]:
!head /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa
C20462:0-2	TC
C21500:0-2	CA
C23900:0-2	TA
C25124:0-2	TT
scaffold585:0-2	AC
C23298:2187-2189	CT
C23426:2243-2245	TG
C24184:2611-2613	AG
C24590:2810-2812	CT
scaffold1340:22077-22079	CT

In [23]:
!grep -Ev 'scaffold' /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa > /Users/claireellis/Desktop/Promoter_nucleotides2
In []:
#Deleted column containing "scaffold" and chromosome location
In [24]:
!wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa
       0   28012 27433172 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Promoter.fa

In []:
# The number of nucleotides for Promoter regions is 27433172
In [25]:
! fastaFromBed -fi /Volumes/web/cnidarian/oyster.v9.fa -bed /Volumes/web/trilobite/Crassostrea_gigas_v9_tracks/Cgigas_v9_COMP_gene_prom_TE.bed -fo /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Other.fa
In [26]:
!head /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Other.fa
>C1:0-100
CGCTAGCGGCAACACTCCAGCAGTATTGCCAAAATGTTACCAGAAGTTGTTGCAGCTAGCGGCAACATTTCACTAGTCTCAAAATCTGGTTTCTGGTAAC
>C10003:0-156
ATTTCACCCATAATACATTTTAACCCTGGATGTTTTCGGCCCAATTGTGTATTATTTTTCATTTGGTAGAGAAAAGGTACATGTATAAACTATCATTGAGAATCAATTGGATCAAACCACAATTAATAATTAGTAAAATTTTAAAGTCACTTTTGG
>C10005:0-156
TTTTTCTAATCAATCATTAACAAACACACTTTTTAAGTCAAAGGCAAAACAAAACACGCATTGGTTTGTAACTGTTAGGGAAAATGTGGGTTTGTTAAAGTCTCAAGAAAGTTAGACTTCACACTAAGCTTCATTAATTTGATTAATTTTTGCTAA
>C10007:0-156
TGTCAAAAAGCTAACCATGGATGATGACACAACCACATTCATCAGAGCTAAAAAAGCAATCTCCCCGGAGTTAACAAAATCTAGCGATAAAAATCATGTCATCAAGAATATTACTATATAGCAATTTATACAAACTTCGACAGGATAACAAAAAAG
>C10009:0-156
AATAATGTTTGGATCTTGTATCTTTGAACTTTTCTTCTTTTTGTATTTTTAAGAATATGACAAAAATTCCGGAAATTAATATTGCAAGAAATTATCAAAAAATGTCCAGACTTCATCAACTTCCGGCCGATTTTTCGGATCAATGTCCCAACAACG

In [27]:
!grep -Ev '>' /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Other.fa > /Users/claireellis/Desktop/Other_nucleotides
In [28]:
!wc /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Other_nucleotides
   81736   81736 297331540 /Volumes/web/Mollusk/174gm_analysis/GenomeTracks_Fastas/Other_nucleotides

In []:
# The number of nucleotides for Other regions are 297331540
In [29]:
! head /Volumes/web/cnidarian/oyster.v9.fa
>scaffold360
TATTCATATATCATTGAGAATGACAGTTTAAAACAGGATTTTTAATTGTGTTTAATAGGCGACCAACATTTAAGTGTCATTTGTTGAGTTATAAGCGAGTTAAAAAGCTTGTAGTTCTTCGCTATGGAAACAAAACTTTACATTTTGTTTACATTTCAGTTTTAGACCTCAAATGAATGTTTTTATCGTTAGGAACTGTTTATTTATGCTTTAAATTGATAAGAAGATTGACAAATCAGCTTGAAAAAGATTTTTTACTGGTGTATTGAACCCAGATGTA
>scaffold18356
TTAAACTGGTACAACAGTATATCCAAGAGAAAAAGGACTTTATAAACAATTTAGAACAACATTGTGGGTCGGATCGGAATTCAAGAACACAGGATCCATTGATGGCTTCTACTATGAAGGGCGATACTACCGCTTGGGGTGACGTCAAATACACTCCGTCATCGACAAAATCTCCTGGATTGTATCCATTACAGGAATTGAAGAAATAACTTTCAATGTAAACAATTTACAAAGATATACATATCTTACGTGAATATCTGGCATGGAAACAACACCTACATGATAGAATAAGACAATATTTCCTACGATACATCCATGGGACATGAAGAAAGTGAAACAGTGTATATCCATATTTAAATTATTATTATAACCGTGTAATCCAAAATGAATTTTATTCCTTCTCATCAGTAAGTACACTGAAAATTGACTACTAAGAAGAGGAAAACACAGAAACGCTAGTTACAACCGATGACCGTTATGAACATAATGCGATTATTTCAGTGAACCGTGTATTAGTGATTTCCTATGTAGGAAGGATTAATATAATTTGCTTCCTATTAGTGTAAT
>scaffold20428
AGAAATTATCCAGGGGTATATTCAGTAATTAAATTTGAAAAAAAAATTGGTTTCAACATATTTTATTGAATAAGGAAAATAGTTTGTATAACTTTAGTTACAAGTTCCTCTTTCTCAATTACTAGAAACTGAATACAACATGATAGAAGAAAATTAGATTTACAGGAATCAATTTTAATTGAGACACACTTGCTATATTGGGGTAGTGACACTTTCTTATAACACAAACTGCTTTTATTTTTTCAGCAGTTCAAAACTTTATTTAAGAGTCTGGAAGATTTTTAAATAATTAATTTTCTTTTTGTTATGGCTATTCTTACACCGTATATCACTCTATTTACCATACAATCACATTTTGTTTTGTTAATGCATGTTTAGGAATATAATTACTATAAAGTCAATATCTACAAATATAATGCATTATCACTATGGCAGTTGTATATATTATACATATTATAATCAAGAGAGAAACATGTAAGTTAAAAGAACTTGTTACCCACCCTCTTGTCCAATAACAATAAAATATGTTCAAATCAAATCAAACAAGAATTGATATACATGTACTAGTATATGGAATTTTTGTTCCTTTTGATGATGTATAGTGAAGAGTTTTTTAACCGCGTCACCTTTCGAATTGAACGTGAAAACCAGCAGGTTGTAAATTTCCTCTACACCATTCTTTTATATTTTTTAATTTTCAAATTTATTGTTGTGATGTTGGCTAAGAATCCTCATTTCAATCCCTTAATTATAATGGTACATGTAAATAAAATGGCGAGTGTCTATCTATGACGTACAAAGGAAGAAGCACTTTCCGGTGACGTAGTTATCACAATGCCCATACAGTGCTTGTCGATTTTATCAACTTTGATAAATAGGTTAAGTTGTATGTATACTGTATAGAATTCATGGATCCAAGGTCATGTAATAATCAACGCAAATTCCATATTGTGTTGAACATCAATTTAGTTTGTGTTATAAATTTGTAAAAGTTTATACATTCATACAAGCACCTGCTGTA
>scaffold18720
TCATGCCGATGATTTATCATACAAACATACGAGAGAAGTATTTAATAAAGCTGCATTTAGGATAATTATATCATTTTGCCATGCCATGACATATTCTGATCATCTCACATCATTGATAAAAAATTGTGCCTTTAATTCCTACCCTAAAATTAAATATTGAATATTATCATAATATTAAATTCAGTTACCTTAGATGTTCCTTTACTTGAGCCGATAAACTGCATGGTTCTATTCATCTTCACAAATAATATAGGAGACAGCCATGTCACCGAGTTTGAACGTCAGCAGGAGGATGTCTGTACAAAAAAATTGCCTTTAATTTGCTTTCAAATTTTCATTTTAAAGTATTGAGAACATTATTGTATAATAATCACCCATATATAATAAAAATCTGTAAAAGAACATCTGCATACTTACATTATTCCTACAGGCAGCCATGATGATAGCATAAGATCAAGTTACTCTGATGGATTTGTCAAAAATGACATCACAGTTCTTTTGGCGGTAATGTTTCATTCACGAGTGCAGAAAAGTTACTATGCATTGATACTGCATTTCATAAATAGTGTAGACAAGTAAAATGCTTCATGATGGACACACATAATATAGTCATGTACATTTAAAAAAA
>scaffold23246
GAATTGATTTGCCACAATTTTTTGTGTGGTCAATCTAAACTAGGTTCCTCAGCTCTGTTTCTAAATTAGCATTCTGTCCTTTTTCAGAATAAAATTTTGCACAACTAACCAGGATCTTGTTAACAATTTTGAGTTAAGTCTAAATATAAATTCAAAAAATCATTTAGAGTTATTAGTAACATGATATACTAGTGTAAGTCATTTTTTGAGAATTCCCAAATGTTCTTTCTGTTGAGTGAAGATACATGTAGGTCACGAATCTGGCACGTTTCCATTTTTTGTAAACTTGTAAAATAAAACATTTTAAAAATTTTTAAAGTAAAAAGGTGGCATTTACAAAATCTGTTTTTAGTTATAAAGAACAATCATATTTAAAATATATAAAAATGCTGTCTTTGGACTCCGAATAATATTCCAAATATATTGTCTGAAAGTTGGACAATTTTCTACTTCAAATATATTATAATACGTACGTGTATTTCCGAATCTGTAGTCTAGCAATGGGTTAACATTGTCACATAAAATTGCATGTTATGGGAAAAACCGGACATTCTATATTTTACTAAACTGTACGGTTGCTTCAACCCATATTGTTTAAAAGCAATGCGATTAAATCAAAGGAAAGCATGGTCAAATGGGAATTCAAATATATAAGTTAAAGAGGAAAAAACAAAACCATTTTATAAACTCGTATATATTTCACTATTAATGAAATAAAAAATAAGCAGTCTCACATGCCCACACACCCCATGACTTGGCAATGCTACACATTACAAATGGCAGAGTACCCTTTATATACCCTTAATAATAACATGGACATAACCACAAAAATCAAAGTACTGAAGTACTTAAACCCGGACTCTTTCGGTGTAATTATGCACATAGTGTAGTTAAATATTCTCTCTCTCTCTCTCTCTCTCTCTTATAATGCTTTGTAAAGAAGTTCATTGAATTAAGAAGAAATTAAACAATAGGAAATAAAAGGAAATTTTAAAAGTTCAGCATGATTCTAAGTTGCTCATGGCTACAGAAAAATGTATAAACTTACCTTTTGATGATGTAACGAAAGCACAGACTGCAAATGTAAAGATTACACCCTTCATTCTATATGAATGTCTATAACTAGGAAGACAGGCTATTTAAATACAAACCTGTTTATGTGATTTTATTTTTAGAAATAACTAAAGTTAGAGCAATACGCAAGTTAAACATGTGGGTGATAGAAATGCATGCAAAACACAGTTACGTCTCTTCAAGCCTTATCAGGCCTTCTCGGCAAAGTTTAGAAAGCATTTTAAATGCATCTGGCATATTCACTTGGTTTTACTTTCCACCTCTTGTATACTGACTGTTGTGATACATTGTACAGTTTAAAATTTAGATAAACTTTTCTTATTATTTGGACTTGATTTCATTTCCAAGAATAATTCTATCCTGTTTTGATTAGCACTGCATATTGAATATTTTCACAAAGTGTTTTATTGTTGCGCGTGTATCTATAGTCTGTTCCAAGTTACACTGACTTTTTTTAATGATTTTGAACAAAAACATGTATACACATATACGTATAACAATACAAGTAAAGTAATAAAGCAAACGTTATTGAAATTAATGATAAAAAAGTGCAAAGACTATTTGTAAAAATACATGTAATCATCAAAAGAACACTATACAGTATAGTCATATGCATAAAAAAAATCAATGGTGTTACTCGTTTATTCTGGAATCTGATATGTAAACTTAAAAAGTCATGAATGTTATAAAACTGTTGATTTTTATTGCTTGATTTTTAATTGGACGATAGTATTAACATGCATTATTACTCTGTTATGTTGAGTATTTATTTTATTTATTCATTTGGTCGAAATTTATCGGCATAATTTGTCGTTATTTTCAAATTTCTGGCGGCATTATTATTCAGTGTTTTAAAATGATTATCACATGACCAA

In [30]:
!grep -Ev '>' /Volumes/web/cnidarian/oyster.v9.fa > /Users/claireellis/Desktop/WholeGenomeNucs
In [32]:
! head /Users/claireellis/Desktop/WholeGenomeNucs
TATTCATATATCATTGAGAATGACAGTTTAAAACAGGATTTTTAATTGTGTTTAATAGGCGACCAACATTTAAGTGTCATTTGTTGAGTTATAAGCGAGTTAAAAAGCTTGTAGTTCTTCGCTATGGAAACAAAACTTTACATTTTGTTTACATTTCAGTTTTAGACCTCAAATGAATGTTTTTATCGTTAGGAACTGTTTATTTATGCTTTAAATTGATAAGAAGATTGACAAATCAGCTTGAAAAAGATTTTTTACTGGTGTATTGAACCCAGATGTA
TTAAACTGGTACAACAGTATATCCAAGAGAAAAAGGACTTTATAAACAATTTAGAACAACATTGTGGGTCGGATCGGAATTCAAGAACACAGGATCCATTGATGGCTTCTACTATGAAGGGCGATACTACCGCTTGGGGTGACGTCAAATACACTCCGTCATCGACAAAATCTCCTGGATTGTATCCATTACAGGAATTGAAGAAATAACTTTCAATGTAAACAATTTACAAAGATATACATATCTTACGTGAATATCTGGCATGGAAACAACACCTACATGATAGAATAAGACAATATTTCCTACGATACATCCATGGGACATGAAGAAAGTGAAACAGTGTATATCCATATTTAAATTATTATTATAACCGTGTAATCCAAAATGAATTTTATTCCTTCTCATCAGTAAGTACACTGAAAATTGACTACTAAGAAGAGGAAAACACAGAAACGCTAGTTACAACCGATGACCGTTATGAACATAATGCGATTATTTCAGTGAACCGTGTATTAGTGATTTCCTATGTAGGAAGGATTAATATAATTTGCTTCCTATTAGTGTAAT
AGAAATTATCCAGGGGTATATTCAGTAATTAAATTTGAAAAAAAAATTGGTTTCAACATATTTTATTGAATAAGGAAAATAGTTTGTATAACTTTAGTTACAAGTTCCTCTTTCTCAATTACTAGAAACTGAATACAACATGATAGAAGAAAATTAGATTTACAGGAATCAATTTTAATTGAGACACACTTGCTATATTGGGGTAGTGACACTTTCTTATAACACAAACTGCTTTTATTTTTTCAGCAGTTCAAAACTTTATTTAAGAGTCTGGAAGATTTTTAAATAATTAATTTTCTTTTTGTTATGGCTATTCTTACACCGTATATCACTCTATTTACCATACAATCACATTTTGTTTTGTTAATGCATGTTTAGGAATATAATTACTATAAAGTCAATATCTACAAATATAATGCATTATCACTATGGCAGTTGTATATATTATACATATTATAATCAAGAGAGAAACATGTAAGTTAAAAGAACTTGTTACCCACCCTCTTGTCCAATAACAATAAAATATGTTCAAATCAAATCAAACAAGAATTGATATACATGTACTAGTATATGGAATTTTTGTTCCTTTTGATGATGTATAGTGAAGAGTTTTTTAACCGCGTCACCTTTCGAATTGAACGTGAAAACCAGCAGGTTGTAAATTTCCTCTACACCATTCTTTTATATTTTTTAATTTTCAAATTTATTGTTGTGATGTTGGCTAAGAATCCTCATTTCAATCCCTTAATTATAATGGTACATGTAAATAAAATGGCGAGTGTCTATCTATGACGTACAAAGGAAGAAGCACTTTCCGGTGACGTAGTTATCACAATGCCCATACAGTGCTTGTCGATTTTATCAACTTTGATAAATAGGTTAAGTTGTATGTATACTGTATAGAATTCATGGATCCAAGGTCATGTAATAATCAACGCAAATTCCATATTGTGTTGAACATCAATTTAGTTTGTGTTATAAATTTGTAAAAGTTTATACATTCATACAAGCACCTGCTGTA
TCATGCCGATGATTTATCATACAAACATACGAGAGAAGTATTTAATAAAGCTGCATTTAGGATAATTATATCATTTTGCCATGCCATGACATATTCTGATCATCTCACATCATTGATAAAAAATTGTGCCTTTAATTCCTACCCTAAAATTAAATATTGAATATTATCATAATATTAAATTCAGTTACCTTAGATGTTCCTTTACTTGAGCCGATAAACTGCATGGTTCTATTCATCTTCACAAATAATATAGGAGACAGCCATGTCACCGAGTTTGAACGTCAGCAGGAGGATGTCTGTACAAAAAAATTGCCTTTAATTTGCTTTCAAATTTTCATTTTAAAGTATTGAGAACATTATTGTATAATAATCACCCATATATAATAAAAATCTGTAAAAGAACATCTGCATACTTACATTATTCCTACAGGCAGCCATGATGATAGCATAAGATCAAGTTACTCTGATGGATTTGTCAAAAATGACATCACAGTTCTTTTGGCGGTAATGTTTCATTCACGAGTGCAGAAAAGTTACTATGCATTGATACTGCATTTCATAAATAGTGTAGACAAGTAAAATGCTTCATGATGGACACACATAATATAGTCATGTACATTTAAAAAAA
GAATTGATTTGCCACAATTTTTTGTGTGGTCAATCTAAACTAGGTTCCTCAGCTCTGTTTCTAAATTAGCATTCTGTCCTTTTTCAGAATAAAATTTTGCACAACTAACCAGGATCTTGTTAACAATTTTGAGTTAAGTCTAAATATAAATTCAAAAAATCATTTAGAGTTATTAGTAACATGATATACTAGTGTAAGTCATTTTTTGAGAATTCCCAAATGTTCTTTCTGTTGAGTGAAGATACATGTAGGTCACGAATCTGGCACGTTTCCATTTTTTGTAAACTTGTAAAATAAAACATTTTAAAAATTTTTAAAGTAAAAAGGTGGCATTTACAAAATCTGTTTTTAGTTATAAAGAACAATCATATTTAAAATATATAAAAATGCTGTCTTTGGACTCCGAATAATATTCCAAATATATTGTCTGAAAGTTGGACAATTTTCTACTTCAAATATATTATAATACGTACGTGTATTTCCGAATCTGTAGTCTAGCAATGGGTTAACATTGTCACATAAAATTGCATGTTATGGGAAAAACCGGACATTCTATATTTTACTAAACTGTACGGTTGCTTCAACCCATATTGTTTAAAAGCAATGCGATTAAATCAAAGGAAAGCATGGTCAAATGGGAATTCAAATATATAAGTTAAAGAGGAAAAAACAAAACCATTTTATAAACTCGTATATATTTCACTATTAATGAAATAAAAAATAAGCAGTCTCACATGCCCACACACCCCATGACTTGGCAATGCTACACATTACAAATGGCAGAGTACCCTTTATATACCCTTAATAATAACATGGACATAACCACAAAAATCAAAGTACTGAAGTACTTAAACCCGGACTCTTTCGGTGTAATTATGCACATAGTGTAGTTAAATATTCTCTCTCTCTCTCTCTCTCTCTCTTATAATGCTTTGTAAAGAAGTTCATTGAATTAAGAAGAAATTAAACAATAGGAAATAAAAGGAAATTTTAAAAGTTCAGCATGATTCTAAGTTGCTCATGGCTACAGAAAAATGTATAAACTTACCTTTTGATGATGTAACGAAAGCACAGACTGCAAATGTAAAGATTACACCCTTCATTCTATATGAATGTCTATAACTAGGAAGACAGGCTATTTAAATACAAACCTGTTTATGTGATTTTATTTTTAGAAATAACTAAAGTTAGAGCAATACGCAAGTTAAACATGTGGGTGATAGAAATGCATGCAAAACACAGTTACGTCTCTTCAAGCCTTATCAGGCCTTCTCGGCAAAGTTTAGAAAGCATTTTAAATGCATCTGGCATATTCACTTGGTTTTACTTTCCACCTCTTGTATACTGACTGTTGTGATACATTGTACAGTTTAAAATTTAGATAAACTTTTCTTATTATTTGGACTTGATTTCATTTCCAAGAATAATTCTATCCTGTTTTGATTAGCACTGCATATTGAATATTTTCACAAAGTGTTTTATTGTTGCGCGTGTATCTATAGTCTGTTCCAAGTTACACTGACTTTTTTTAATGATTTTGAACAAAAACATGTATACACATATACGTATAACAATACAAGTAAAGTAATAAAGCAAACGTTATTGAAATTAATGATAAAAAAGTGCAAAGACTATTTGTAAAAATACATGTAATCATCAAAAGAACACTATACAGTATAGTCATATGCATAAAAAAAATCAATGGTGTTACTCGTTTATTCTGGAATCTGATATGTAAACTTAAAAAGTCATGAATGTTATAAAACTGTTGATTTTTATTGCTTGATTTTTAATTGGACGATAGTATTAACATGCATTATTACTCTGTTATGTTGAGTATTTATTTTATTTATTCATTTGGTCGAAATTTATCGGCATAATTTGTCGTTATTTTCAAATTTCTGGCGGCATTATTATTCAGTGTTTTAAAATGATTATCACATGACCAA
AATGTCAATACACTCTGCACATTAACCTGTATTCGAATCAGTGTAGTGACACAGTTTTATAGTTTTTTATATATCATTTTTGGTTATAAAGACATCGTGTTTGACAAAATAGTTTGCCTTTTAACAAAGCCACCACCTCCGCAAAAAAGTAAACCCCTCCCCCCCAAAAAAAAACCCACGGAAAAAGCAACAAAAAACCCCCCATCTATTATCTATTATGTTGTAATTTTTGTTTTTATTTAAAAAGCCTTTGTTCTCATATCTATTGGAGTAGTAGCATTGAAAATATTTAGTACTTTAAATCATATCATGCAAAAGACATCCATTACCAAATACAACAACATTTATAACAAATAAAGTTTCAAAGCAGTTGATAATTTTGAATTCACATTGTCTAAAACTTACAATGCTTAATTAAGGCATTTCCAATTGTCAACCAAAATTTAACTGTCCAAATATTATAAGCTTCATACTTTCTTGTTACTAGTAAGTAAAACAATGGTATTGCCATATTTTGTCTATACTGGCGAGTTTCGTAGAGATAATTTTTTTTCTCATCATAACAAACAAATAATTAACGCTTTTATGGTTTGTCATATTTCATAGGGTTTTCAATATAACAATGTTTGATATGTTCAAATCTCGCTTGTAACCCGACAACAGGCATTCATATTTGAATTGACCATCCGAAGCATCGCAATCTTGCATCGTATATATCACGCAATGAAGATTAAAAGTGTCAGCTTAAATCGTAACATTGCACCTTTAACATTATCAATGAATCAAATGAGCTATCAGAATGCCTTTTGTGTTTTAAATTTACTTTTATATTTTACGTGATAATTTCTGGGTTAGACGTGCACATGACCATATATGGAGTTAACTTTCGTCACAATGGACGCCTGTCTCGTCATTGGCTTCGTCATAAGAGTGTAGAAGCGCAGAACCACGTGCCTGTGCTACTCAGTCCCGAAAACTGCAGACAGATTACCTTGTGACTGCATATATGTCGGGAACATTACGTATGCTAATTTATTCTAACGACGAAAACAACATTATGAATGATAGAATGTTACGTTTCATAACCTTTCTTAATTAGATTCTTCTAAAAATGGACGATCGAATTGCATCATTGTAGATTCTTGAACGCAACTTTTTACCTGTTGTTTTTAAAGTTCACCGCAAATGTACCTTGGGTTATTAATAATTTAAACGAGATTGAAAAAATGAATTCATATTACCGACATATGAATCAATGCATAACACTCCTGATGTTAGCTTTTGTTGGAGCAGGTTAACGATATGGTTACCTCGCTCTAGGCTTGTTCTGCTGTCTGCAAAACAGTCGTCATATATACAGTACACATCGTACTGAACCAACCTGCGACCCGCTACGGACACATACCGATAGGTCTTCACTTGTAGCGACCCGCTACGGACACATACCGATAGGTCTTCACTTGTAGCGACCCGCTACGGACACATACCGATAGGTCTTTATTTGTAGCGACCAGGAACCTGGTGAATCTAGTTATCTCTCCATCCTATACCAAATATGGGTACACGAGCATGGACGATTTCAGACTTCAGTCAAAATTTCAGTCATTCATTAAATACTTATTAAAATAAGATTGACACTGAACTTGTGTAAAATTCAACAAGACAGCGAAACGATTCTAAATTGCATTTTGAATTTGGTAGTTATGGCATAATTAATATGTGGTGTGATGAACAAATTTTGACTAAAATTGCTTCATGATCCTAGCACATGGATTTATTCCTTAACAAACATATTTACTACATTTTGGAACTTGTATACAAGTTATAGCTTACAACACCATATTTTGTTTTGAAAATTCAATATAGTTTGAATAAACACCAGAAACTTGTGTTGAAAAAAAATGTTACAACTGTAACATTAACTTTCATCAACTTCCAGATTTCAATACATGTACTTGTTTAGTGTTTTCTCATACTCTAGTTATTTTGAAAAACAAATTACGGATAAGTTTAGCAGTTGAAAAAAACCCAATTCAGATTTATACAATTTCCTCAATAGTAAATTGACAAAACCATTTTGCCAGTGACTTTATTTTAAAAAATAATAATGATTTATTTTCGACTACATATATTTTCTGATAATATTTTCTAATTGGATTGTCAAATTTGATATATTTATTTATCGAAAAATGGATTTTTCAATGAAATATATGCACAAAGTCTAACGCACCCGAAAATTGTATTGTAAAAATATCAGTTTCTTAAAACTATTAACTCATAGAAGGGAAATCGGATGATAAACCAAACATGAATTTAAAAACACCAAGTACAGTAATTTTCATTTAGTCACAACAAAACAAAATTTTACACACAAAGTCAGAAAAACAACTGATTTTGTTGACAAGAATAACATCCAATCACTTGTGATGGCCAATCCTACGCTATCAT
AATGAAATCTGAATAAATACACATAATCAATAGTAATGTGAAGTGAGAACTAAACCCTAAAAGTGTAGATGTCAATTTTAATTACTGATCACACATGAAAATGACCCTGTGCCTTTCAGTCGGCTAGATTATAACTGAGATGACTGGGACGATGACAGTACACGAAGGGGGTCGAAATTATGTTCACGGTCGCTTGATTTGGCAGCAAGACTTACATCGGCTTAAGAAGCTAATTCAAGTTGAATGGATGGGGTGGGGGTGGGGGGCAAGCCTATATAATGTCTGACAAGGCTGAACAAGAGATGGGGGAGAGGTCTCAGTTCGAAGGAATGTGGGAATGAATAAAGGCAGGGGGCAGGAAGCTGGTCCCATCGGCAGTAAACTAGGGGGTTAATACTCTTTGTAGTATATTATCGGGTCACGTTAATATAAACCGCATGCACAGNTCTTTGTAGTATATTATCGGGTCACGTTAATATAAACCGCATGCACAGAGTCTATATTAAAAGTATACAAGTATGAATTTTTTCAATAGCATTGCAATGTCTAATAGTGTATATAAAAGCGAAAGTCGATTTTACATCATTACAAAAAATCAAAAAGGGAAGGTTATTACAAGGAAAATGGTCTGAAATTAAAGACTTCCGTCTAATCAGTTCAGTCCCGGTACCGTAATTCTGTGTACACTGTCTACACTGTCTAGTGTCTAGTCTTTAAATCAATTGGCAAAGGCAGATCTGCAGTCTTGTTTGGGATTTTTTACTCGTCATTTTGTAAATCAAAATCATTTCCTGAGCGCAAGTAGATACTGCACTTCCGGATTTTA
CAATAATATTTATAATTCTATAAGGTATATATGCAAAGGACCTGTACGTTCAAAGGAAATTGGTTAGCATGTTTTTAAACTAGCATTAAGGTAATTATTCATACGTAACAAAACAACGTCTGACGTAATCCATGCGTCATTACATCTTGTTACTGTCCGGTCTGATTCGGATGCATCTTAACATGTAGAACAAAGAAATTAAACTGAAATAAAAATCTGACTTCAAACAAATCTATTGAAAAGCATCACAACTACAAGCAATTATTGTAATCGACGGAATAAAANGGGGGATAAATACACGAAGGAAAATTTAAAGCGAATTCATCTTTATTTTATACGCTTAGCAACACACATAAATATATTATCCCTAAATATCGTTTTGAGAATTAAAGCTATACGCTGACAAAAAGTTCTTTTTTATTGTTAGAACAGTCTTTAAAACCAGTA
ATGGTTATACCTCAAACTAATTGCAACAGAAATGTTTTTTGTGGAATTCGTGAGAAATATAACGTATTAAAAAAATATCAAAAATCGAGAAAAATCGAAATAGGGGAAAGTCGTCAATTTTGGCCCCCCCAAAAATCTAGATTTTACTTCAAATATTAGTCTTTCTAGCCAAAATATGACCAAACCTCAAACTAATTGCAACAGAATGTTCTTCTAGTTTTCCAAGCTGGTTTAGGTGAACTGTTGAACATTAAAAAAAATCGAGAATGTTTGGATGAAGGGAAATTGTTAATTTTGGATGAAAACCTTGGATTTTGATGAAAAATCGCCGAAAACTGGAAATTTGCCGTGACTAAAAAACAAAAATAGCAACGGACTAAATTTTTAAGAAAGTCAATAGATCTTATTACAGTTATGATTTATTTCAACGTTGATGAAATGCAAAGTTCAGGAAATTGAAAATTTTGGGTGAAAACTTTGGATTTTGATGAATAATCGCCGAAAACTGGAAATTTGTTGTAACTAAAAAAAGAAAATAGCAACGTACATAATTTTTAATCAAGTCAATAGATCTTATAACAATGATAAAAAAAATTAAACTATGATGATTTTTGAAGTATAGAAAGTGATAATTTTGGGTGAAAATGTTAGTATTTTTGATAAAAATTTGGAATTTATGTTTTCTTAATAAAAATTAAATTATATCATGAGTCTTCAAATTAATTTTATATATATATATATGTTAAGTGTTTAGATGGATCAAATAATGACCAATTCGTAAATTCAATAGATCTTATAACAACAATAAAAAACGATTGACCGGTATGATACTTTTTTTAAAACCAAAATATTTACTTTATATGATTACAAAACCATGGAATTGTTGTACCGAAACCCCTTAATTATGCTTATTATGTTTTTGCGTATTCTACATTAATCTTTAGAAGTTGATTGTCACTTAATCGTCCATGTCAACTGTTTTGCTCGAATTTGTACAACCAGTTCCTTTACATTCGCCACAAGCTACTGAACATTCAAGTCCGTTTTTTCTACAAGTACATCTTTTAGTGTCACAGTTTGTCTTACAATTGCATCGAATAATGTTCAGCAATTTAGAGGGAGCTTAACTGTACACTTAACTGGAACAAGGTTTCCATTAGCGACTTTCCAACCCCATTCACACGGATTTAGATTGTCCTCGTTCATCCACATTTTCATTTGAAGATAAGCCCTCTGGCTATGAAATGAAGCCGCATTTGATGTTGGCGGCAAAGTATGAATTTGAACGCATGTTTTGTTTGTCAATACTCTTGCAGCAAACTTCCTGTAGCGAAGAACATTCAGTTCTTCATATGGAGCACCATTATATAAAGAGGAAATAATGTTTTCACCAGCAGAAATAACATCATCCTTTGCGTTAGCATTGCATAGTAACTGTCGAGTCTTGAGAAAGTCATGTTCTGCAAATTTCTTTAGGGTCGCTGCCTTACTGACACCGAACATTCTTGAAGTTGTGTCACAACCACTAATAGCATGAATTAAAGGTAACAATGTACATAGCTCCTCACCAAGCAGCACTTTGGTCTTCAAAATATCCCATATTTTAATATGTGTGTTTACTTTTGACACATTGCCGGATTTGAATATCAGCGAATTTGATGTAACGTCTGCATGATGAAGGAGTAGTACCAAAAGATCAGTGTCCTCTCCAAGCAAAACAGTTGGTTTTGTTTTCGCCGATTCGATGGCAGTAAGGGCTATCAATACATCAGCATCGGCATCTGCGTGTTTTGTTTTGATTCCCTTTTCTACCATCTTGTTTGCTTGTTTCGAGACGGGGATTTGCTGACCAGTTCTAAAATTAACACTACATGTTTGGTGGTATATTGCGTCTGCCGCGTGCAAATCTGATGGTGCAATGTTGAGCCTCCTCAAAACGATTTCGGACCATTCATCATTTCTTTTTTTGCAGATGTTTCTAAGGGTGTTAGAAAAATCTGTTGTCCTGACAGGAAACACGTCGATTCCCCTTTTGCATTCTGAAAATTTTGCAAAATATCCACAAAATAAACAGTTCTTCTGGAACTCAAAATCAGGAGTAGAAGATCGTAAGTCACGAGTTGGCTCGGTTATCGATACATCCTTTTCTCGCATGTAATTCTTGATTGAGTTAGCATTAATGTAATCACGTCGACATTTCTGATGAACTTTTTGTCCTGGAGTTGTGACGATTGTATTATTTCTGGTTTGGCTGGTCCTATTAACTGTGTTACATCCTTTTTCTCTTAGTTGTGTTATTTCTTCACCATTTTTTAGAGACACCCGACAAAAAACACAAGCATACATCATTACCTAAAAAAAAGAAGATCAAACTGTTAAGATGAGATTCAATTATTTTGATTTTGCTTTCATATTATTTTTATCATATAAGATTTGTTTTGAATACAATATTAAAAAAGATATATATGTTGACTTATAACCAATAAATTATTCCGATGAATTATCTGTTCTCAATTGAATTGTATAATGGTATTTTTGTTGAATATTAATTTCCCTCTGTTAGTTGATTAAGAAATATTCATTTTTTATCATTTTATTTTTTTTGAAATTGTCTCATCCTGTCCTCCCTATTTTTTTTAATATCTTCCTAGCCCCCATACTAACATGAAAAAATAAATGGTAGCTCCATAACACAATTTTTCTGCATCGATTTTGTATTTGATTATCGGTAGAACTTCATTTTTCCATGACTTAAATTTGGTTAGATTGTAACCTTTTTGGCACTATTGGCGTTCCATAGTTTTTTTTTTCGTCAGCAACTCCTAGCAATAAGAATAAAATTCCCTTTTTACGGGACTATTTAATGTATGTAATGTATATACAGTAGTCCAAATATAAAAAAACAGAGCTGTTTTGTATGTGATTTCTGGTTTAGAAACCTCGGCAAACCGAAATGAGCTCATTTCTGCCGCGTACTACATTTTGACGTTTCCCGTGTATCTACGCCTTTTAAAAACATCCAAAATACCTTGCATGGTAGCGTTAACTCTTAAGAATGTTAAATAGGTATACAACTTTTATATATAAGTTTTATATTAACTTACCAGAATGAAAAGGATGGAACCTAGATGCGTCGTCTGCAGTTGACCATTACGAGTTGTCTCCCATATCGTCATTCTTAATCTACGGGCGCCATATCTTTCCATAATATTTGAAGTAAAATCTAGATTTTTTTGGGGCCAAAATTGACGACTTTCCCCTATTTCGATTTTTCTTGATTTTTGATATGTTTTTTATACGTTATTATATTTCTCACGAATTCCACAAAAAACATTTCTGTTGCAATTAGTTTGAGGTATAACCATAGAATGACTGGACTAAAACGAAACACTGCAAGTTTATACTTGCCAATGCATATATTAGGTTATATTTACAAAATTCATATAAAATTATGTACAGAAAAGAATTACCCACGAACTTTCAGATAGCCACTTTTCGACTAAACGCAGATTTTATTGAATTTATCATATGTAGTATAGATTTATTATACCTTTGTGACTATTTTCTGTGTAAAATTGCAACAAATAAACATGCTATTCTATCTAAACGTGAATTAGTTTCCGTGCTATCTGCCCAAGGTGAATAGTCATCGAAACTAGTATTCACCGGTGGCATTCGATTTCCCTCCTTTTTAAACTCGGAACACCTCTGACGTATTCCGATCGATCGCTACATTAAATTCAAAATTCCGATAACTCTAATGTGTTTATCATCAAGAAATTGTGCATCGCAGACAAATTATTTTTTCTTCTGTATAATGAAATACCTATTTACTGTCTACGAGGACGATAACTTTTTCGGCTTCGCCTCGTGAAATAGTTGCTGTCTTTGGGGACAATAAACTATCGTCCTCATAGCCAGTAAATAGGTATATAATATCTTACCTTGTGTTCATGATTGTAACTCATGTGAATGCATCTTAAAATTGAATACAAATTGTCCAGGTTTACTGGTTAGTGACATGTCAAGTTGAGTTTAGCGATTTGAAATGTTTAAATGTAAATGTTGAAACAGGAAAGTAATATTTACTTCTTCATGTACAATTATGTACACGTGTTACTTTTAAATTGATTAAATTGAAAATAAGGTTATAATTTTTGGTTATAATGATATAATCTATGAACTTCAATAGTTATGATATTACGTTTGAAAAAAAAAATATGTTCAGTCTGACAAAATACTAGTAGTAACCTTGAAATAGTCAGCTTTCGTGGGGTTCATTTAGGTTCGCCTAATATTAACACGAAATTACATCACAAACTGTTTATAAAACACATGTTCAGCCTGTATATAGTTTACATACGATCGATTCTACGGGTAAACATTCTTTAAAAAAATTGAAATATTAAGTAGCCACGAAAATTGGCTCTCACAAATTAATTTAAATGAATCCACAGGGCTTGTATGATTTTGCTCGACGATCCGATCTGATTTATACTTTTAAGATTGTTTCTTAAGTCACACATATTGCATGGTAGGCTGTATATATTAATAAGATCTTCCCCTTAAACTTTTGACAGATGAAATAGACAGCGATGTATTTACTTCTTATCTCCAATCAAATAGTCCAATCATCAAAGGAGAGGAAGGAAGGATAACTCTGTTAGAAGACTGTGCAGCGAGTAACTCGATGATTATCAAACCTAACGCATTCAATCTTTTTGTTATTCTGTTGGTTTTCTTTAACATTCCTCTGTGTTTGCTTTAGAGGTTCTGTAAGTTCAAATAAAGGTTTAAACACGTTCGTTGAATGTTTTTTTTCTTTATTTAGATGAGTAGAAATGTTGCAAATAAAGTAAAACAGAACAAATTAGACCTTGGATTTTCGGCTGGACTTTGCTTTATATTGCTGACATGCATTACAACAAGTTAAGAATGAAGCTGGTTTCTAGTGAAATATTCATAGATTGCGAAGGACTTTCACATAAAATTACGCTGTCTAAATCAATTGCATAAAAAAAGATACGAGAAATAAATAAAAATTATTTTATTTTCTTTTACCTGCCCTTAAAAAATATACAAAAAATTTGACATGTCGAAGAACTATTTTCTGTGATGTGGGAATAAATTTACATACTAAATGAAGCACCAATGTAATTGACAAACTGATCAATCAGCTATATGACATTCCCGAGTTTAAATGCATCATGGGTTACTACAAAAAATTCTATACGTTTAGATAATGCTTGTTTTTTTAATTGCTTTTGGGAAGGCAAAATCAATTTTTTTTAAAGCTTTACAAGATTTACGTCATTATCTACCAATTCCATGCTGACATTAGCAAACACTATTTTTACAATGGTAAAAATTTGGTTTCATCAACCTGTGAAGACTGTGAAGACTTTATGAGAGGCATTTAGCATGAGAGATGGGCAATGTTTGTTAATATGAGCATTAGAAATATTAATAAGTAATAAGATTAGTAATCTTTATTAGTACTTAATCTTTGCATTTTGTTTTAACAAAAAATTGAAATTTTTTATGAATTGACGTTCCCGCGGGTTTTTGAATCGAGTCGCAATTAGTTTTAAATCGTATATATGTACTGTCATATAGTAAATCACATTTTTTATTCACTGATTGAACAGTTGTTCGCGCTTCGCATCGCCCTGTGCAATGGCAATAACATCCATGTAAGGTAGTTTCCCCGACCAGTTTGAATAACCCCGCCTAAAGTGGGTCACGTGACATCCATCGCCGGTCTATCAACAACAATGGCGGCGCGGCGCATGAAAGAGGGGTAGAGATTTAAGTTTGACAGTTTTGGCAAGGAAAGAGAAAAAGAAACAGACTGGCAAGGATAGGAACAAAAAGAAGATCGTCATCGGTGACCATGTGCATGTAGACTGATGTATTAAGAATTAACACCGAATTGAACTTAAGTTTCCATCATGCAGGTGTAGAGCTTTTTCAGACACTGACGTTCGTGTTCCATGTCTACTGTGTCTTTACTTTATAAGTTATAAACTACAACTGGATTTTCGTATAAAGAAATTTTCTAATAAAGAATAGATAAACACCCTCAGTACAAGCATCCCTCGGGGGTTGGGGGGGGGGGGGTTTTACTCTGTTTACCGTGTCAATGACGCTAAAATCGTGTTTCGTTTTAAATACACACAATTTACAATTTATATCGTTCAACATTAATGAATATCGAAATATTGATGCCTCGAGTAGCATCTGATATATCTAATTTAAGACACGAAAAATGTTATTCTAAATTGTAAACTGTTCTTCCATTGTGCTTTCAATGCTTGGTTTTCCCGCACAGAGTCTCATGCGCAGTGGCGTTATAAATGGCGGATCACATTAATAGTCAATAGACGTGTGGCAAAGTTTAGAGAGAAATAATTAAAGACAGAACATCTTAAATGGGCCTAGAGTTGGTGAAACGTTTAGTTATAAGAAGCATGATGTATGATTTTACTCGAACTCGTGTCAAAATTTTACTCCAAATACGCCACATATACCTTTAATGAATGACATGAAGTCCGATTGTCAGCTTTCTTCCATTAGCCAAAAACACCAAAATTTTAAAATTAATACAATGTACATGCAATGTGACAATATATATGTCAGTGACAATTTCTTTAAGAAATCTTTCAAAATTGAATGCAAGCCTTTAGAACAATTCAACACGATTGTATAATTATGTATCCAGAATACCCTCTGCAAGAGTTCAAACGCAATGCAAAGATATAGTTTAACTTTTAAGATAAAATCTCTACAGTACAGGAATCATGACGTCATATTCAATCTCATCAGATAATCGAGACTCCTTAAAATTAGTTTTCTTCATCTGTACTTAAAATAGACTCTACCTAACAATGAATCATAGCAACTTTTGAGATGTTCTTTTATAAGGACGAAATGTTTTTGTAACGCCTCCTCAACAGACAATTTACCTATTGTTCCATAATTAATTCTGTTTGTTCTACAATGTATGTGTTTTTCACAAATATTATTTGATCATCTGCTTTGCAGTTTGTAAATGTCAGTGGTGAAACAATGTAATAAAGCAAGAATAAACCCCTTTTTAATGAGACCTTTGAGAATGTGCAAGAAAACACCGTGCATAAATTCCATCATGGTAAAATAATTTTTTTCAACAATTTTTGTGCGACTTAACAGTTAAACACTGATCTTGTTTATATACATGTACTTGTGATGAAGAACAATATTATTGAGTCAGTAACTAACCTAATAATTGTTTTGTTTTCCCGAAGACTATCAAGCGACATATTAATTCACAAATAGCGATGATCTACGCAAAACCATGTACAATATGCCTCACATCTAGTCTAATTTAACTCATTTAAACTCTTTAAAATTTTCAATCTCACCTTGCAAATACTCTTTAAAAATCTTTGCTTCACCAATGTTTACTTAACAATGTTTTGTTGCTATTCAATTTTAAATGTTTTCTCCCTTTCCTCGGCAGAGATTTGAGCAAATTTCAAAAAGGGGAACTACTCTAATTTTAAAGAATTTCAAAGGGCAACTACCCAGTACTCCAAATACTTTAAGAACTGACGGCATGCGATTTATGTACTAAATACTATGAAATGGCGAAATCAGTAAGCGAGGCGTCGGCCGATGACGGCCATATTGCCTAATATTATTTCTCACCGAACAAATATAGATATATGAGGCAATCACGTGCTATGTTTAAACCAATGAAATTGTGACATTTTAGTCCAAGGGAAAACAAATAATACTAATATATATGATATTCTAACGTTAAAACTCGTTGTCTAAACGTTTTTTTTTTTCATTTTACACCAATTTTATTAACAAAAATGTTGTAAAGAAACGTTTGGGTTTTTTGAAGAACAGTAATAAAAACTATATTGACACAATACGTTCCATTAAGCGAAATCCGTTGCATTGTGCACTGAGAATGAAGTAAAATGAACCGAGCGCGGACATGAATAACAAAATAGGTTTTTGTCTTTTCTTTAATGAGAAAACAATGTGTTTGGAATAGGATCAGGGACAATCACTTCAGCTGAAATAACAGGATAAGTCGACTTTAAAGCCCAATTTCCTTTGTACGTGTTAGCCGCGGATAGTGTACGACTATTTTTCACGATCAGGCCTAATTCGCATCCGTTTTGTAATTATATTCATACAGTAAGCACTGGTTCGCGGCGAAAATTATTCGCGACCACGAAGTTTTCGCAAAACTAGCGTATATTTTTCGTAAAAAAGTTGGTTTACTTTTTTCATTCTCATGAGCAACCTTTTTTTAAAACATATTTTAAAATAAATTTTACCAATGTATTCATACTTGACAGTACAGCCATTGCATACAAGTATAACAAAATAGCTATTAGGGAACGATCTGAAAAGTTAAATCGACAACTCATTTTCAAAATTTGTTATAAGACAATATATTATACACCATGAAGTTGTATATGAAAGTTTAACAAATTGAATAATTTCCCTTTTTAAAATCCGTCCATATTCTTTTAGTTTTAATGGATTCACAGACAGAAAACATCATTGGTTTTTCAAAGACATCGTGCGTCGTTGTTGTCCGTTTTTTGTCCGTCCCACCATCTGTCTCACACTTCATGAAGAATAACGGATATTGGTGCAAAAAAATAAATAATTTAACGCTCTTGACGTACAGTGGAGTTGAATTTTTCTTTTCAAACCTTGGAGCTTTAATTGATGTAAATTGATAAAGAAGTTTTAACAAAACGTTACTTGAATAAAATATCCATAAGCTTAAAATCACCGTAAATTAAATTTTACTCGCGACTCTATTTCGCGATTAACTAAAGATGAACTGGTTCGCGGCCTTGCCCCAGGATCATGCTTCATGATCCTTGGACCTTATCAATATTATGCTTTGTTTTAACAACCACGCGATAAATGCTGCTTTTCAGCGAGAAGAATGCGCGACGACCAGGGTCTGTGGCAACGCACTTTAAAAAAAAAATATGCAGTGTAGAAAAAAAATTTCAAAGTGCGTTAAATTTTGGATCAAATCAACGCACTTTGAAAAAATTTTCGAAGTGCGTTTTTGGGACCAAATTAACCCAGTTTGAAAAAAGGCTCTCGTAAACCCTAGGACAAGTAAGCATATATCTATAGTTTTACATCTGGTTACTCAACACTTCGGTGCATAATTTTATATTGCGCATGTTGACAACATTTGGAATTAATAAATTTATTTTAGTCAAATGAAATTTTCATAAATCTGTATCAAACTATATACAATGAACGGTGCGACCAATTTGGTAGCGCACTGTATCAGTATAAATGTAATGGTAATGCATTGCAATGCATTACATGTTTTCAAAGTAATGCTAGTAATGTGTAATGCCACAAATTAAGCATTACAAGTATTGGTAATGTTATACATTACTTTCCAAAATCTAGTGTAATGATAGTATTACATGGCATTACTTTGCATTGCTATGCTTTTTAATGCATGTTCATTTTCATAACATTGTGATGAATTGAATAACTGAAATTTTATTTGATTCAAAATTGTTTTAAAGAAGAAAAAATTCTTGAGATAAAAATATTTTAGTTGTATGATTAAAAAAACACCCACTCTTAAATTGTCAAAAAAAAACTAGCTATATAATACAATTTCATAACATTCAAGAGTGTTCTTTTTCATCGTCGGATACCCACGGGTGATCGCGTCTTTTACTTATCGATAAGTAGAAGACGCAATCACCCGTGGGTACCCGACGATGGTTCTTCTTAAGAATTTTATATCATTTGAAAAATTACTGTTATTAGTTGTGCATTTAATGAATTCATTACTTTGAAGAATGTGTTAACAACACACAATGTCCCAAAAGTATAAAAACAATCAATTGTTTAAAGAGGTGCTAGTTGAAACACCCCAAATCCCAACCCTTATCTTGGCTTTTCACAAAGTTATGGAATGGTAATGCATTACTTTCCTCATGTAATAGTAATGTAATGCATTACTTCAAAAAAACTTAGTAATGGTAATTTAAT
ACTTGAGTACAAGATAACTATTTTTCACTTTCGAACATCAATTTGAATACATGATCCATTATAAAATGTTGTTAGAATTATGAAAGGAATTATTTTAATATGAAACATGGGTATTTTTCGGTTTATTTGAGACGCCATTTGGGTAAATTGTCGCACCGGAGAATTAGCCAATCGGCGTTACTGATCTATAATTAGATTTGTTTACAAAGAAGGCTGAAATTCGGGGAGCTGCATATGAGCAACATTTTACCTTAACAAACGTTATCAAACTGAAAAGTAAAAGTCTTGTACATCAAGTAACAAAGAGTGTGTCTGTGTACACTTCAAGAATTCAGTGTAAGTATATAGTACATGCATTTGGGACGAAAGAAACGGTGCATCGCTTGCATGCGCCATCTTGTATTATACAAAGGCTTTATGAAAGAGATCAGTAGTAGCTAATGTTCTGAAGTCACATTAAAAATATTTTAACACAAAACGGAATTGAAATGGTTGAGTACTGAGTTGTTTATTGTGTATGTTGATTTTGTTAAAATGAAAGAGCATAACATCAAAAACCTATATTTCGTGCATCACGACTGAGCCTTGGATTGTGACAAAATCCGAACAGGGCGCCGAAGGGGATAATTTATTACCTGGTCGTATTTTCTATCCAGGCATCTCGTTTCTGCTATGTTCCCCGGGAATGACAATTCTAAATAGAGAATACTTAATTTTGACAATTTATATGTTGTTTTTTTCTAAAATTTTCAAACTCTGAACTAATTTAATTGTTTGAATTGGAATGGGGTTGGGACAAGAGATTAACAATTTGGGTTGAACCTGGTTTGAATTTTTTCTACTCGCCCTCTGATATTTCACACTAATATCACCCTGTTTTGTTTTTTCATTTTTTTTTATTATATTTTTATTGTCCTCTATCTGAAACATTAAAGTAATAATCCTATAGCTACAAATTTTTTCTTATTCTGCATGTACGTTTATCAGCTTGAATGCCTTGTCAAAAATGGATCATAATTTATACAAAGTGGTTATTTGTTCGAAGTTGGCCCCTTCATTTAGAGGAGCATTGTCACAATTTTGGTCAAACTTGATTTTTTCTAATTTTATTGCTTACAATTTTTTATCATGGGATTTGTTTGATGAATCAATATTTGAGTGTCAGTTGTACTGGCGTGCAACCAGTTCTCACCGAGTACCATTTCTCACCAGTACATTGATGTCATTTCTCGTCTATTATTTTATGTGTTGATAAAATGACGTCACAATGTACTGGCGAGAAATGGTACTCGGCAAGAGATGGATGCACGCCAGTAGAGTTAATAAGCAGGATACAGAACTCGCAATTCTTTGTTACATAAATAAGGTAACTGGTTTGTGTCATGTATTTGTTTACATTGGATTGATACATGTATGTAGCCAGTGGTCGAAATAAGCCAACCTTGGATCATTGTTAAATATTTATTAATACAGAATACACCTGAAATTTTGTTATTAAACAAATAACAAAGAATAGACACAATAAATGACAAGACAATTAGACACAGACAAACATACACATTAGAAAACGAAATGAAACAGTAATATTACAATTTAGAATGACTATAATTCATTACATTAAATCTTACCGGGACAAACAATCCTAATGCATAAGTATATTGCTATACAGCTATAGTTTTGACCCGTTCAAGGGCTAGACGGAGAGTGCCAGTCCGGTATAAGTGTGACCCTATAGTCCAGTCTTGTCATTGTCCACGTTACAGATATTAAACTCTCATACATAATCACTCACTCAGACTCTAAACACGTATACCAATCAATACCGCTAGCGCTGTAATTTAATATACAAATTATATAACTGGTTACATGTATTTTATGAACAGTTTTTTCAAGCTCAATTTTCTATCTGTTGTCTTTTAGTTTTGAACATAAATAAACAGTTCCTAGCATTTGTCTTATTCATTTTAGCTAAACTTTGAAAATTTAAAATGTACGGTAAACAAAAACATGACATGAGCCTTTTTCATGACAAAGAATTGTAATCTGTATATCTCACTGATAAGTCGTTGATTGACAATCAAATTTTGGTTGACTATTAGAAATGCGTTGCTTGTGCAGTGTAAACATTAAAACGCAAAAATGAATTTTGACTATAAAATTATGACCCTGCCCCTTAAGGTAGCTTGGTTTATCTAGGAACATAAAATTTTGACCATATTGGTTTTAATAATTAGTGCAACTCTTCTATACCCTGTCCTGAGTTTTTGATTCCACCACTTTCGGCTCGATATTTTGATAATCATAAATACCTTTGTGTGCCAACTAGGTTTATCAAGTAGATCTAATATGAAAAATGTCCAGATTATTTGTTTTGAAATGCCCCCTTTATCGCTTCAGGTTTCAATACACATCCCAAATGAAAAGTTTACTGGGAGTTTGTTTTACATCAGCCATGTATTGGCTCATATGATATCATTGTAAAATTTTGTGATGTCTTTCAAGTAAGTTTCGGACGGTGAACAGATGTAAACATTTCTCATTTTAAATCTCTGGAAAGAAAATTTCAATGAAGATATTTTGGATATTTCCCTTTTAATAATTTCAACTGTATTTCGTTCACATGTATGTGCATTCAAATTAATGATCATAAAAATTTGATGAAAGCAATAACTTGAGACAGACTATAAAATGTATAAAACAGCTGCACGCATTGTGTGAAACTTTTTTTCCATTTAGGACACAGTGACAGTCACTGTAGATGTGCATATTACCTTGAAATTTTGATTTTATTATATAGCTTGGAATATTGGCCCTTTAGAACTTAAAATTTTGGCTATATATTGAAAATACAAATTAAGAGTTTGTAAACGCATGTCCTCTAAAACTTATGCAAGGATTTTCATGAAATTAAATAGGTATTTAGGACACTTTGTTTATATGTACATCTAGCAGGACATATTCCTGATTCCAATATTTTTTCTTGAAAATGTGTTCTTTTTGAATTTAGATTTATGCTCTTATTAAAGAATAGGTGTGCATATTTGCAGAAATTTTAAGCTGATGAATTTTAGCTCACCTGAGATAAAGGTTAAGGTTTTCTGATCAAAATTTGTTCATTGTGAGTCATCGTTGTAAAGTTTTCATATTTCGAATTTCTTTTCCCAAACAATTGGGGCAATGTCGATCAAACTCAGCACAAAGCATCCTTGGGGGATCGGCTTTCAATTTTGTGTTTAAATTAAGGGTTACTTTCCTTCCTAAGGAGGGATAATTAGGAGAAAGTGAAAATAGGATTACAGTACTGTCAACACAGATCCCATAGTTTCCTTGTACCCCTGCTGTCCAAATTTCAATGCGGTTTAAGATAGGTGTCTAAGGTAAAATTGAGCGCCCCCGTGCAGAATCTTTCAGCAAGTAAACACCATCTGTGACTTGACGATAAATTACAGGTGACCAAAAGTATGACTGAAATGTGTGTTATCTCCCTTGACTAAGAAAATATTTGACAGCTACGCTTAACTATATATCATTTTATTTAATGAAACTATATAAAATAACGTATGATATATTTTTCCAATGTTGAATTTATTGCATTTGTTCAAAATCATTCTTTTAATCATTTAGTTATTTGACAATATATTTTTACAATCCATTAAAATTGACTTAGCCTATTTAAATATGATAAATATGCTTGGCAGTCAGATTAAAAAAAAAATTTTTCAGTCTTATTAAATTGTGAAGAAATATTGAATGTTTTCTGCTTAATCTACGCAAACTGCATGCTGGAAAAATTCAAATAATGAAATGTTTTTCTTGATTTATATCCATGCAATCGAATTTCAAACAAACATTTTGGCCAGTTTGCAACCGCATTAAAGAAAACAGAAAGTACACAATTACAATATACATATATTGATCATATTTATATTTGGTATGTATTTTTAGTTCTTAATTTACTTTTTCATGGGCAAGGTTTTCTGTACAGTTGATATAATATACGGTTTGGAAAACAGCGCAGAGATTTACATTAACTGTTTTTCCTACTTTTCCATTTGTACAAATCACCAAGATTTTTTCTTGTCCGAACTTCTAACTTCCCTTGCCTGAAAATTTTCCAATATTTAAGATCCAATATTGTCAACAAAAAATACATGTACTACAGTCTGTATTACTAAAATAAACTCCTTTATTATAAATAAATTATTCTTGCTATAATTGATAACCTCACATTTCAAATGGAAACTTAAAGCGTCTTTCATAAATGTATTTGTGCGATGTAACATTAATTTAAACATGATTTGTCAGCTGTAGCAAGTGTCAAGGCAAATTTGACAAGACATTTTAGCATCTGGTTTAACTGTTTGTCATCTGATATTGTATTTTCAGTGGGTTTTTTTTTTAGGTAACCTGATTCACTCGGGTGACCTTATGCAATTGGTCTTTGTCCGTCGTTGTGCGTTGCACGTTAACAATTTTACATTTTTAACTTCTTCTTGAAAACTGCAAGGCCAATTGTTACCATATTTGGTTTGAAAGTAGAATCTAAATTGTGAAATTTATGGCTCTACCACCCAAAAATTTCCTTTTCTACTCCCACACGTGTGGAAAAATCTGAATGCATGGTTATGATGTCTATGAACCCTCTACCAAAATTGTAAAAGTCATGGTCCTTAGGTCAAGGGTTTAAGGATCTAGGGTGGGGCCAATATGGCCATATTATAAAATGTATTAGATCTTAAATCAAAGTATTGAAGTACTAAAAGTTGAGCTCTTTTGGTGTGTCTTTGTGCAGTTTGTGTAGTAATGTCGGCAAAGCGTATGAGAGCGATTAAATTTTGTAATCGGGTATAAACAAAAATATGTCTGTATAGTAGAAAAAAGTTCAACAGTTGCTGCCTTGAATTTTGCAACAAGTGTTACAATTCAATTCCCATTTCTTTAACCCGCAGCTAAGTAGTTGATGGAAATTCATTCATGCCCATTGTATGTGTCCAAAATGCATAGTCTTGTTTTTGAAACTCGATTTTAATAAGAACTTGAAATTAAAAAAAGAAAAGAAACAAAATGCCAACACTTTTGACAAAATGTGGCTCTTTGTATAACTATTTGGTATAGCTGAAGCTTTTGCTTAGACGCTGTTTGGTTTTTTAAGGCGTCGAGCTAATGCTCGGCAGCCTTCTAGCGATCGTCTGGATTGGCAATCGTCCAAAAATTCATGCACTGCACCGCCTTTTAAATGCGCACAAAAAAATAAGTTCCTTATAATATTAAACGTATTACAAGATTTTTATTCCATTTATTCAACTACATTGTGTACAAAAATTCCAACCTTGCCTCCCTGGTTATTGATAACTCTTTGCATAAGTATAAATTTGCCTATTCAAGAATGGCGGATGAATACAAAAGGTGTAAACATTACTAAATATTATTTTAGTTTATCGATTACATTATAACTGGAGACCGTGCCCGATAGAAATAAAATTTGATATGTAAATTTATTTGTTATCGGGCACGGCCTCCAAAATAAATGTAAGCGATAAACGTATCTAGTGATTTTGTTGCAATAAATAAACACGATAATGCAGTCGGTTTGGTCGAGCAAAATAAACAACCATACCATAGGTAATCTTGTTTCAAACGGGAATTGAAATAAATAAAAGTATGTTTTATTATTATAATTAGAGACACACTGTAATCAATGTATTCACCTTGAAAATTGTTCAAAGACTGTTTAAAGCAGAAAGAAAATAAAAAAAAATTTTAACTTTGAAATTTCTTTGATTTTTGTAACTATGATGAGTTATTGTATTATAAACGCATCACAACCTATTATATATGGAAATATAGTGATTTTTGTTTTTAAAGAACGCAAAACATAAATTATTTACTTTTTTTTATTCTAATATGTATTATTTGATATATACGACTATTAGTACAAAAATTCAAATTATTGATATCATTTTATCAATCTATATAAAAGAAAATGTCAGCTCGACGCCTTTGTGGCCGTTCCGGCCTTTGATTGTTTACTTTTGAAGTTGTGCTATTTATAGTAACATTGGCGGTTTGCCTGCTTACAACCCAGGACTCTGCTTTCAGCAGAGCCGGCTAAAAATCTTCTTTACTACTCCCATATATATTTGTTAAAAACTAAATGCATGGTTATGATGTCCATGAAGTCTTTCAACTCAAATTTGATATATAATTGTGTATTATAAATACAGAATTACAGATTGAATTACAATTTCATTCCATTCTGATGATTTTTTGCAGAGTTATCCTTCTTGAACTTAAAAAAAAATGGTAAATTTTATTATCTGATCATTTTCTCAACAATTGTTGCACACATTCTACTTAAGTTTTACATATGGAGGTGTCATAGTAATTTACAGGTTAAGTTCAAATTTGGTTCCAGTCGAACAATTTTTGACAGAGTTGTGCCTTTTGAAATTTGAAAAAAAATTAAAAATTCTCTGTTAGGCCCAACAAAAAATAGGTTTATTTCCGCTTTCAGACTGAAAAAAAATAGGGCGGTAGGTCGTTTTTTTTTTTCCCTTTCCATCTGTTCAATTGTGCATATTAAACCATTTATCTATTAAACTGGGTAAGATAAAAAAACAACCCATGTATTTGTTGTCATTGTTTAAATGATTCCAAGGCTGGTGGGAACATTTCTCGAGCTCAACTGGCACGACATGTGCTGCCATTTGTAAATAACAAACATCTACACAACACTGATGACGTCTAAATAAGTTCCATAAGCGTTTTATGACTTAAATTCAGAGGACACAATAAATTTTTAAGTCGGATAAAAACGAAATTTTACCAAAAAAACCCTGATAAAAACGGAAATTTACAAAAAAAAACTCAAAAAAAATGTTTTGGGTCGACGGGTTTAAGTTAGGGTTGGTCGGGAAAGCAGAAACAAACCTATTTTTTTTGTTAGGCCTTACCGCTCTGTAATATTTGAAGGGATGCATATATAAAGCTGATATTTCATATGAAATATTAAAAGACAATACAGATGAACTTTGAAATTAG

In [33]:
!wc /Users/claireellis/Desktop/WholeGenomeNucs
   11969   11969 558613125 /Users/claireellis/Desktop/WholeGenomeNucs

In []:
# The number of nucleotides in the oyster genome is 558613125